15 research outputs found

    Dependency profiles as a tool for big data analysis of linguistic constructions: A case study of emoticons

    Get PDF
    This study presents a methodological toolbox for big data analysis of linguistic constructions by introducing dependency profiles, i.e., co-occurrences of linguistic elements with syntax information. These were operationalized by reconstructing sentences as delexicalized syntactic biarcs, subtrees of dependency analyses. As a case study, we utilize these dependency profiles to explore usage patterns associated with emoticons, the graphic representations of facial expressions. These are said to be characteristic of Computer-Mediated Communication, but typically studied only in restricted corpora. To analyze the 3.7-billion token Finnish Internet Parsebank we use as data, we apply clustering and support vector machines. The results show that emoticons are associated with three typical usage patterns: stream of the writer’s consciousness, narrative constructions and elements guiding the interaction and expressing the writer’s reactions by means of interjections and discourse particles. Additionally, the more frequent emoticons, such as :), are used differently than the less frequent ones, such as ^_^.</p

    Investigating the cross-lingual translatability of VerbNet-style classification

    Get PDF
    VerbNet—the most extensive online verb lexicon currently available for English—has proved useful in supporting a variety of NLP tasks. However, its exploitation in multilingual NLP has been limited by the fact that such classifications are available for few languages only. Since manual development of VerbNet is a major undertaking, researchers have recently translated VerbNet classes from English to other languages. However, no systematic investigation has been conducted into the applicability and accuracy of such a translation approach across different, typologically diverse languages. Our study is aimed at filling this gap. We develop a systematic method for translation of VerbNet classes from English to other languages which we first apply to Polish and subsequently to Croatian, Mandarin, Japanese, Italian, and Finnish. Our results on Polish demonstrate high translatability with all the classes (96% of English member verbs successfully translated into Polish) and strong inter-annotator agreement, revealing a promising degree of overlap in the resultant classifications. The results on other languages are equally promising. This demonstrates that VerbNet classes have strong cross-lingual potential and the proposed method could be applied to obtain gold standards for automatic verb classification in different languages. We make our annotation guidelines and the six language-specific verb classifications available with this paper. © 2017 The Author(s)</p

    «La relation de limitation et d’exception dans le français d’aujourd’hui : exceptĂ©, sauf et hormis comme pivots d’une relation algĂ©brique »

    Get PDF
    L’analyse des emplois prĂ©positionnels et des emplois conjonctifs d’ “exceptĂ©â€, de “sauf” et d’ “hormis” permet d’envisager les trois prĂ©positions/conjonctions comme le pivot d’un binĂŽme, comme la plaque tournante d’une structure bipolaire. PlacĂ©es au milieu du binĂŽme, ces prĂ©positions sont forcĂ©es par leur sĂ©mantisme originaire dĂ»ment mĂ©taphorisĂ© de jouer le rĂŽle de marqueurs d’inconsĂ©quence systĂ©matique entre l’élĂ©ment se trouvant Ă  leur gauche et celui qui se trouve Ă  leur droite. L’opposition qui surgit entre les deux Ă©lĂ©ments n’est donc pas une incompatibilitĂ© naturelle, intrinsĂšque, mais extrinsĂšque, induite. Dans la plupart des cas (emplois limitatifs), cette opposition prend la forme d’un rapport entre une « classe » et le « membre (soustrait) de la classe », ou bien entre un « tout » et une « partie » ; dans d’autres (emplois exceptifs), cette opposition se manifeste au contraire comme une attaque de front portĂ©e par un « tout » Ă  un autre « tout ». De plus, l’inconsĂ©quence induite mise en place par la prĂ©position/conjonction paraĂźt, en principe, tout Ă  fait insurmontable. Dans l’assertion « les Ă©cureuils vivent partout, sauf en Australie » (que l’on peut expliciter par « Les Ă©cureuils vivent partout, sauf [qu’ils ne vivent pas] en Australie »), la prĂ©position semble en effet capable d’impliquer le prĂ©dicat principal avec signe inverti, et de bĂątir sur une telle implication une sorte de sous Ă©noncĂ© qui, Ă  la rigueur, est totalement inconsĂ©quent avec celui qui le prĂ©cĂšde (si « les Ă©cureuils ne vivent pas en Australie », le fait qu’ils « vivent partout » est faux). NĂ©anmoins, l’analyse montre qu’alors que certaines de ces oppositions peuvent enfin ĂȘtre dĂ©passĂ©es, d’autres ne le peuvent pas. C’est, respectivement, le cas des relations limitatives et des relations exceptives. La relation limitative, impliquant le rapport « tout » - « partie », permet de rĂ©soudre le conflit dans les termes d’une somme algĂ©brique entre deux sous Ă©noncĂ©s pourvus de diffĂ©rent poids informatif et de signe contraire. Les valeurs numĂ©riques des termes de la somme Ă©tant dĂ©sĂ©quilibrĂ©es, le rĂ©sultat est toujours autre que zĂ©ro. La relation exceptive, au contraire, qui n’implique pas le rapport « tout » - « partie », n’est pas capable de rĂ©soudre le conflit entre deux sous Ă©noncĂ©s pourvus du mĂȘme poids informatif et en mĂȘme temps de signe contraire : les valeurs numĂ©riques des termes de la somme Ă©tant symĂ©triques et Ă©gales, le rĂ©sultat sera toujours Ă©quivalent Ă  zĂ©ro

    Nature des marqueurs des séries linéaires dans des articles scientifiques

    No full text
    En adoptant une approche textuelle, cet article propose d'examiner les diffĂ©rents types de sĂ©ries linĂ©aires, c'est-Ă -dire de sĂ©quences Ă©numĂ©ratives consistant en Ă©lĂ©ments textuels au moins partiellement introduits par des marqueurs linguistiques. En outre, nous Ă©tudions les contextes textuels dans lesquels les diffĂ©rents marqueurs sont utilisĂ©s. Une sĂ©rie linĂ©aire prototypique, par exemple, peut consister en items introduits par des marqueurs d'intĂ©gration linĂ©aire (cf. Turco & Coltier, 1988) (Jackiewicz, 2005) : "PremiĂšrement... DeuxiĂšmement...". Le corpus de l'Ă©tude consiste en articles scientifiques publiĂ©s. Nous commençons par classer les sĂ©ries selon le(s) type(s) de marqueurs. Les items des sĂ©ries homogĂšnes sont introduits par le mĂȘme type de marqueur de linĂ©aritĂ© (entre autres "PremiĂšrement... DeuxiĂšmement..." et "Le premier... Le deuxiĂšme...") tandis que les types de marqueurs des sĂ©ries mixtes varient. Les sĂ©ries partiellement non-marquĂ©es, par contre, contiennent aussi des items sans marqueur explicite ("D'abord... 0... Le troisiĂšme..."). Les sĂ©ries non-marquĂ©es, enfin, sont seulement introduites par une prĂ©diction ("Cet article consiste en deux parties...") ou rĂ©tro-Ă©valuation ("Ces trois Ă©lĂ©ments..."). L'Ă©tude rĂ©vĂšle que les fonctions textuelles des diffĂ©rents types de sĂ©ries ne sont pas les mĂȘmes. Les sĂ©ries homogĂšnes sont explicitement introduites et souvent prĂ©cĂ©dĂ©es ou suivies d'une prĂ©diction ou rĂ©tro-Ă©valuation soulignant le nombre exact des items. Ainsi, ces sĂ©ries organisent le texte en blocs clairement ordonnĂ©s et dĂ©terminĂ©s. Les sĂ©ries partiellement non-marquĂ©es, par contre, contiennent des marqueurs relatifs et des items non-marquĂ©s qui ne prĂ©cisent pas l'ordre exact de l'item introduit. De plus, le nombre exact des items de ces sĂ©ries n'est spĂ©cifiĂ© par une prĂ©diction ou une rĂ©tro-Ă©valuation que rarement. Par consĂ©quent, ces sĂ©ries structurent le texte, de façon plutĂŽt imprĂ©cise, en Ă©lĂ©ments dont les limites et l'ordre exact ne sont pas nĂ©cessairement primordiaux. Outre la fonction textuelle de la sĂ©rie, le marquage des items est influencĂ© par leur longueur ; les sĂ©ries Ă©tendues, globales, ne sont pas marquĂ©es de la mĂȘme façon que les sĂ©ries courtes, locales. Au niveau global fonctionnent surtout les sĂ©ries partiellement non-marquĂ©es, tandis que les sĂ©ries non-marquĂ©es ainsi que celles introduites par "d'une part - d'autre part" et "l'un - l'autre" relient des Ă©lĂ©ments courts et fonctionnent au niveau local

    Dose dependent but non-linear effects of alcohol on the left and right ventricle

    No full text
    OBJECTIVE—To assess how left (LV) and right ventricular (RV) size, wall thickness, and mass depend on daily alcohol consumption. Among alcoholics, most common findings have been LV hypertrophy and mild systolic or diastolic dysfunction, accompanied occasionally by ventricular dilatation resembling dilated cardiomyopathy. Although it is commonly agreed that chronic heavy alcohol use is injurious to the heart, the dose-injury relation remains a matter of dispute.‹DESIGN—Prospective series of 700 Finnish men aged 33-70 years who died out of hospital and underwent a medicolegal necropsy.‹METHODS AND RESULTS—Data on alcohol use and other risk factors were obtained from the spouse. At necropsy, a transversal slice of the heart was traced on a transparent sheet and analysed later for LV and RV cavity areas and wall thicknesses. Coronary artery stenoses were measured from silicone casts of the arteries. In analyses of all men, daily alcohol dose predicted heart weight (ÎČ = 0.17, p < 0.001) and RV cavity area (ÎČ = 0.14, p = 0.007) independent of body size, age, coronary artery disease, hypertension, diabetes, and smoking. In the subgroup of men free of significant coronary artery disease, LV area averaged (SEM) 11.0 (1.0) cm(2) in men drinking < 12 g/day, 7.7 (0.7) cm(2) in those drinking 72-180 g/day, and 10.0 (0.9) cm(2) in those drinking > 180 g/day (p = 0.054). Very heavy drinking (> 180 g/day) was associated with an increase in RV cavity area (p = 0.005).‹CONCLUSIONS—The effects of alcohol on the heart in middle aged men are dose dependent but partly non-linear. In the absence of coronary artery disease, LV size shows a U shaped reduction with increasing daily alcohol use accompanied by an increase in RV size with very heavy drinking. These findings question the idea of progressive LV dilatation with increasing alcohol consumption among male victims of sudden death.‹‹‹Keywords: alcohol; cardiomyopathy; remodelling; sudden deat
    corecore